Vés al contingut

Distribució conjugada

De la Viquipèdia, l'enciclopèdia lliure
Infotaula distribució de probabilitatDistribució conjugada

En la teoria de la probabilitat bayesiana, si la distribució posterior es troba a la mateixa família de distribució de probabilitat que la distribució de probabilitat anterior , l'anterior i el posterior s'anomenen distribucions conjugades, i l'anterior s'anomena a priori conjugat per a la funció de versemblança .[1]

Un a priori conjugat és una conveniència algebraica, que dona una expressió de forma tancada per a la posterior; en cas contrari, pot ser necessària la integració numèrica. A més, els priors conjugats poden donar intuïció mostrant de manera més transparent com una funció de probabilitat actualitza una distribució prèvia.[2]

El concepte, així com el terme "conjugat anterior", van ser introduïts per Howard Raiffa i Robert Schlaifer en el seu treball sobre la teoria de la decisió bayesiana.[3] Un concepte similar havia estat descobert independentment per George Alfred Barnard.

Exemple

[modifica]

La forma del prior conjugat es pot determinar generalment mitjançant la inspecció de la densitat de probabilitat o la funció de massa de probabilitat d'una distribució. Per exemple, considerem una variable aleatòria que consisteix en el nombre d'èxits en Assajos de Bernoulli amb probabilitat d'èxit desconeguda en [0,1]. Aquesta variable aleatòria seguirà la distribució binomial, amb una funció de massa de probabilitat de la forma

L'a priori conjugat habitual és la distribució beta amb paràmetres (, ):

on i es trien per reflectir qualsevol creença o informació existent ( i donaria una distribució uniforme) i és la funció Beta que actua com a constant normalitzadora.

En aquest context, i s'anomenen hiperparàmetres (paràmetres de l'anterior), per distingir-los dels paràmetres del model subjacent (aquí ). Una característica típica dels priors conjugats és que la dimensionalitat dels hiperparàmetres és un més gran que la dels paràmetres de la distribució original. Si tots els paràmetres són valors escalars, hi haurà un hiperparàmetre més que un paràmetre; però això també s'aplica als paràmetres de valors vectorials i matricials. (Vegeu l'article general sobre la família exponencial, i també considereu la distribució de Wishart, anterior conjugada de la matriu de covariància d'una distribució normal multivariada, per exemple on hi ha una gran dimensionalitat).

Taula de distribucions conjugades

[modifica]

Sigui n el nombre d'observacions. En tots els casos següents, se suposa que les dades consten de n punts (que seran vectors aleatoris en els casos multivariants).

Si la funció de versemblança pertany a la família exponencial, llavors existeix un a priori conjugat, sovint també a la família exponencial; vegeu Família exponencial: distribucions conjugues.

Quan la funció de versemblança és una distribució discreta

[modifica]
Confiança Paràmetres Distribució conjugada Hiperparàmetres anteriors Hiperparàmetres posteriors
Bernoulli p (probabilitat) Beta
Binomial amb nombre conegut d'intents, m p (probabilitat) Beta
Negative binomial amb nombre conegut de fallides, r p (probabilitat) Beta
Poisson λ (ràtio) Gamma
Categorical p (vector probabilitat), k (nombre de categories) Dirichlet on és el nombre d'obserbacions en categoria i
Multinomial p (vector probabilitat), k (nombre de categories) Dirichlet
Hypergeometric amb mostres totals conegudes, N M (nombre de blancs) Beta-binomial
Geometric p0 (probabilitat) Beta

Referències

[modifica]
  1. «Conjugate Prior Explained» (en anglès). https://towardsdatascience.com.+[Consulta: 9 juliol 2023].
  2. «Conjugate prior | Definition, explanation and examples» (en anglès). https://www.statlect.com.+[Consulta: 9 juliol 2023].
  3. Howard Raiffa and Robert Schlaifer. Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration, Harvard University, 1961.